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摘要 :【 目的 ] 提 出 机 构 知 识 库 影音 


持 能 力 扩展 方向 , 实现 CSpace 机 构 知 识 库 影音 


音 资源 支持 能 力 扩 展 


持 能 力 扩展 。[ 应 用 背景 】 


影音 知识 资源 在 机 构 产 出 中 所 占 比例 不 断 增长 ,扩展 机 构 知 识 库 影音 支持 能 力 可 更 好 地 揭示 、 发 现 影音 知识 资 
源 , 挖 气 和 利用 其 学 术 研究 价值 和 潜力 。[ 方法 ] 分 析 用 户 的 应 用 需求 和 国内 外 机 构 知识 库 影音 支持 服务 的 发 展 
趋势 , 构建 机 构 知 识 库 影音 资源 支持 功能 扩展 框架 , 选择 其 中 的 关键 技术 和 方法 搭建 实验 平台 ,探索 将 其 应 用 
于 CSpace 系统 的 可 行 性 。[ 结果 ] 实现 了 影音 格式 转换 、 视 频 场 景 分 析 和 具有 场景 导航 功能 的 播放 器 。[ 结论 ] 
影音 转 码 稳定 性 和 效率 较 高 ,其 他 影音 支持 功能 离 实 用 还 存在 一 定 距 离 , 将 影音 格式 转换 技术 应 用 于 CSpace 机 


构 知 识 库 系统 中 , 能够 扩展 机 构 知 识 库 的 影音 支持 服务 。 
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机 构 知 识 库 (Institutional Repository,，IR) 是 机 构 数 
字 知 识 资产 长 期 保存 与 应 用 的 重要 基础 平台 ， 随 着 信 
息 技 术 的 发 展 以 及 开放 获取 运动 的 兴起 , 机构 数 字 知 
识 资产 的 可 靠 保 存 、 有 效 组 织 和 重用 成 为 科研 教育 机 
构 关 注 的 热点 问题 ， 越 来 越 多 的 科研 教育 机 构 开 始 规 
划 或 着 手 建设 机 构 知 识 库 系 统 。 

CSpace 是 中 国 科 学 院 兰 州 文献 情报 中 心 研发 的 
机 构 知 识 库 系统 ，2007 年 开始 部 署 于 中 国 科 学 院 所 属 
研究 所 , 为 研究 所 开展 多 种 类 型 知识 产 出 的 采集 、 保 
存 、 管 理 和 传播 利用 提供 了 可 靠 稳定 的 政策 、 平 台 和 
服务 支持 。 经 过 近 10 年 的 发 展 , 目前 除了 中 国 科学 院 
系统 的 110 多 个 研究 所 使 用 之 外 , 正 逐 步 向 院外 用 户 
推广 , 已 在 多 家 科研 机 构 、 高 校 以 及 企业 部 署 使 用 。 
随 着 多 媒体 技术 的 应 用 和 普及 ，CSpace 用 户 在 机 构 知 
识 库 系 统 中 存储 的 影音 类 非 文本 知识 资源 比例 不 断 增 


m} 


究 成 果 之 一 。 
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K, 用 户 对 影音 知识 资源 的 存储 和 应 用 方式 也 有 了 更 
高 的 要 求 , 为 了 适应 用 户 的 需求 ,更 好 地 揭示 、 发 现 影 
音 知识 资源 , 挖掘 和 利用 其 学 术 研 究 价 值 和 潜力 , 需 
要 进一步 扩展 机 构 知识 库 影 音 知识 资源 的 支持 能 

本 文 梳理 了 国内 外 在 影音 资源 长 期 保存 与 应 用 方 
面 的 研究 现状 , 结合 当前 机 构 知 识 库 用 户 对 影音 长 期 
保存 与 应 用 方面 的 需求 , 构建 了 机 构 知 识 库 影音 存储 
与 应 用 功能 扩展 架构 , 并 对 其 中 的 关键 技术 进行 研究 
与 实践 , 将 较为 成 熟 、 稳 定 、 可 靠 的 影音 支持 功能 
成 到 CSpace 系统 中 , 扩展 了 CSpace 系统 的 影音 资源 
文 持 能 力 。 
2 国内 外 研究 现状 

随 着 信息 技术 的 发 展 , 影音 数字 资源 已 经 成 为 科 
研 人 员 普 遍 产 出 和 应 用 的 知识 资源 中 国际 上 越 来 越 多 
的 大 学 和 科研 机 构 开始 通过 扩展 IR 或 建设 专门 数字 知 
识 库 的 方式 培育 和 发 展 机 构 支 持 影 音 等 非 文本 知识 资 
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源 存 储 、 组 织 、 管 理 和 服务 的 能 力 。 根 据 OpenDOARDI 
(The Directory of Open Access Repositories) 开 放 数 字 知 
识 库 登 记 系 统 的 统计 数据 , 全球 已 有 740 多 个 数字 知 
识 库 不 同 程度 地 涉及 影音 的 存储 管理 。 

从 当前 国际 上 IR. 对 影音 的 存储 管理 和 文 持 能 力 
来 看 ,一 般 采 用 类 似 于 文本 内 容 管 理 的 方式 ， 文 持 对 
影音 对 象 进 行 描述 、 上 和 载 和 保存 ,提供 基于 元 数据 描 
述 的 检索 和 发 现 利 用 , 同时 大 都 在 内 容 的 呈现 过 程 中 
般 入 相关 的 媒体 浏览 器 或 播放 器 ,提供 在 线 浏览 和 播 
放 利 用 的 服务 , 如 DSpace! 、Fedora 中 。 部 分 研究 机 构 
已 经 尝试 在 IR 中 引入 相对 成 熟 的 场景 、 语 音 、 文 本 和 
图 像 识 别 等 基于 内 容 的 影音 分 析 方 法 和 技术 ， 以 增强 
IR 对 影音 内 容 的 描述 和 组 织 能 力 ， 如 德国 国家 科技 图 
书馆 专门 成 立 了 非 文本 文献 能 力 中 心 (Competence 
Centre for Non-textual Materials), 将 多 媒体 存储 和 分 
析 方 法 应 用 于 大 学 演讲 视频 的 情景 、 语 音 和 图 像 的 元 
数据 处 理 和 识别 , 并 将 识别 结果 和 文本 知识 进行 语义 
集成 关联 , 方便 用 户 像 获取 文本 资源 一 样 快速 地 查找 
和 使 用 数据 巨大 的 影音 知识 资源 5E9; Yovisto BERE TIL 
频 门 户 将 自动 视频 分 析 与 用 户 自主 的 标注 、 评 价 等 
Web2.0 服务 进行 集成 应 用 , 视频 播放 具有 场景 导航 功 
能 ; ScienceCinemal 中 是 由 美国 科技 信息 办 公 室 (OSTD) 
和 欧洲 核子 研究 中 心 (CERN) 共 同 创建 的 科学 视频 门 


户 , 采用 微软 提供 的 音频 索引 和 语音 识别 技术 , 用 户 
可 以 检索 视频 文件 语音 中 特定 的 词语 , 检索 词 可 在 音 
频 片 段 中 突出 显示 。 

近年 来 ， 国 内 机 构 知 识 库 建设 进入 快速 发 展 时 
期 ， 高 校 、 科 研 机 构 以 及 公共 图 书馆 在 机 构 知 识 库 或 
专门 数字 知识 库 建 设 中 也 加 强 了 影音 知识 资源 的 支持 
能 力 研究 ， 如 大 学 数字 图 书馆 国际 合作 计划 (China 
Academic Digital Academic Library, CADAL) 项 目 由 浙 
江 大 学 图 书馆 与 中 国 科 学 院 共 同 承 担 ,对 影音 中 的 文 
本 、 声 音 和 视频 信息 进行 分 析 提 取 ， 用 于 影音 资源 的 
检索 ; 清华 大 学 的 基于 内 容 的 视频 信息 管理 系统 
TH-CVIMS(TsingHua Content-based Video Information 
Management System) 通 过 镜头 切 变 和 渐变 检测 、 视 频 
特技 镜头 检测 等 基于 内 容 的 视频 分 析 方 法 ,实现 了 视 
频数 据 分 割 、 标 注 和 检索 等 功能 ; 国防 科技 大 学 多 媒 
体 研 究 中 心 和 系统 工程 系 研究 开发 了 新 闻 节 目 浏览 检 
索 系 统 (New Video CAR) 和 多 媒体 信息 查询 和 检索 系 


统 (MICR), 能 够 对 新 闻 视 频 的 内 容 进行 自动 分 析 、 分 
类 和 管理 ,用 户 可 以 快速 定位 感 兴 趣 的 新 闻 片 断 ， 也 
可 以 快速 掌握 一 段 新 闻 的 大 意 。 此 外 ,北京 大 学 、 浙 
江 大 学 、 上 海 交 通 大 学 、 复 旦 大 学 、 中 国 科 学 院 计 算 
技术 研究 所 、 微 软 亚洲 研究 院 等 一 些 科 研 机 构 都 开展 
了 相关 的 研究 , 并 获得 了 一 定 的 成 果 * 趾 。 在 IR 领域 
之 外 , 国内 在 影音 的 存储 、 人 处 理 和 利用 方面 的 技术 发 
展 较 快 , 如 百度 旗下 的 爱 奇 艺 已 经 将 视频 关键 帧 提取 
与 展示 技术 应 用 于 视频 平台 中 , 用 户 在 视频 播放 过 程 
中 , 将 鼠标 放置 于 时 间 线 上 即 可 看 到 所 指 时 间 的 视频 
画面 , 为 用 户 快速 浏览 和 查找 所 需要 的 视频 资源 提供 
了 便利 ; 优酷 播放 平台 除了 和 爱 奇 艺 一 样 , 提供 视频 
关键 帧 导航 功能 之 外 , 在 时 间 线 上 还 通过 视频 内 容 提 
示 点 ,将 视频 分 割 成 若干 个 视频 片段 ,在 提示 点 标注 
视频 片段 的 内 容 信息 ,进一步 为 用 户 提供 了 便利 。 

总 的 来 看 ， 加 强 影音 知识 资源 的 支持 能 力 建设 已 
成 为 机 构 知 识 库 建设 中 的 一 个 重要 研究 方向 。IR 领域 
ZI, 有 关 影 音 的 处 理 和 利用 技术 发 展 较 快 , 通过 内 
容 分 析 和 索引 技术 的 应 用 ,提供 基于 内 容 的 按 例 检 
索 、 可 视 化 导航 等 新 型 信息 发 现 利用 已 经 成 为 一 种 方 
向 和 趋势 。 有 关 的 研究 和 成 果 , 也 为 IR 扩展 影音 支持 
能 力 提供 了 更 加 丰富 和 有 力 的 方法 与 技术 选择 。 


3 ”机 构 知 识 库 影音 资源 支持 功能 框架 


3.1 功能 需求 

CSpace4.0 系统 支持 对 影音 知识 资源 的 描述 、 上 载 
和 保存 , 但 由 于 影音 资源 的 格式 复杂 多 样 ，CSpace4.0 
自身 没有 格式 转换 功能 ,为 了 满足 影音 资源 的 在 线 浏 
览 播放 需求 , 用户 在 上 传 影音 资源 的 时 候 ,， 首先 需要 
在 本 地 计算 机 上 通过 第 三 方 视频 格式 转换 工具 ， 如 格 
式 工厂 将 视频 转换 为 可 在 线 播放 的 FLV 和 MP4 格式 ， 
然后 才能 上 传 到 CSpace 系统 中 。CSpace4.0 系统 部 署 
应 用 后 , 用户 反映 有 时 按照 系统 说 明 , 将 视频 格式 转 
换 成 符合 要 求 的 格式 之 后 , 在 CSpace 系 统 中 也 无 法 进 
行 正 常 的 播放 浏览 ， 经 排查 发 现 : 

(1) 用 户 上 传 的 视频 虽然 显示 的 是 FLV 或 者 MP4 
格式 ， 但 视频 封装 中 视频 流 的 设置 有 问题 ， 导 致 无 法 
播放 ; 

(2) 视频 文件 的 Moov Atom 元 数据 信息 一 般 放 置 
在 文件 的 前 部 ， 主 要 描述 视频 的 时 长 、 分 辩 率 等 基本 
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言 息 ,视频 播放 器 需要 加 载 视频 的 Moov Atom 元 数据 
言 息 ,才能 初始 化 播放 视频 文件 。 正 常情 况 下 视频 
Moov Atom 元 数据 应 该 放 在 视频 文件 的 头 部 , 但 有 些 
视频 文件 在 封装 时 将 视频 描述 信息 置 于 文件 未 尾 , 视 
频 播放 器 无 法 加 载 到 这 些 信息 就 会 一 直 缓 冲 ， 从 而 无 
法 实现 视频 的 边 加 载 边 播放 功能 。 

另 一 方面 ,国际 上 部 分 研究 机 构 已 经 尝试 将 视频 
场景 分 析 、 关 键 帧 提取 、 语 音 和 图 像 识别 等 影音 分 析 
处 理 技术 应 用 到 机 构 知识 库 或 数字 知识 库 平台 中 , 可 
为 用 户 提 供 更 好 的 影音 支持 服务 。 根 据 用 户 的 需求 反 
馈 以 及 机 构 知 识 库 影音 支持 能 力 的 发 展 趋势 ， 机构 知 
识 库 影音 支持 扩展 功能 包括 : 

(1) 影音 格式 转换 

视频 文件 由 音频 流 和 视频 流 封 装 而 成 ,音频 流 和 
视频 流 的 编码 格式 以 及 视频 的 封装 格式 都 有 多 种 类 
型 ， 从 而 导致 视频 文件 的 格式 复杂 多 样 。 寿 不 对 其 进 
行 统一 的 格式 转换 , 将 给 后 期 进一步 的 分 析 、 处 理 和 
应 用 造成 极 大 的 困难 ,为 便于 后 期 的 处 理 和 应 用 ， 当 


用 户 提交 影音 文件 后 ， 需 按照 统一 的 转换 格式 和 参数 ， 
对 其 进行 转换 处 理 。 


(2) 影音 信息 提取 与 标注 

影音 信息 包括 技术 元 数据 信息 和 内 容 元 数据 信 
息 ,技术 元 数据 信息 如 码 率 、 分 辩 率 、 时 长 、 比 特 率 
等 的 提取 较为 容易 ,可 通过 现 有 的 开源 工具 FFMPEG" 
完成 。 内 容 元 数据 包含 的 信息 较 多 ， 如 视频 镜头 、 场 
景 、 文 本 、 图 像 、 声 音 等 多 个 方面 的 信息 ， 需 要 综合 
采用 多 种 方法 和 技术 抽取 获得 , 其 提取 的 充分 性 、 完 
整 性 和 准确 性 将 对 后 期 的 视频 检索 和 应 用 产生 直接 的 
影响 。 

Q) 影音 播放 导航 

通过 影音 信息 自动 提取 与 标注 技术 获得 的 视频 场 
景 、 关 键 帧 、 内 容 文本 等 信息 需 通过 一 定 的 方式 进行 
组 织 呈 现 ， 从 而 使 用 户 能 够 实现 方便 的 检索 、 发 现 和 
应 用 。 通 过 在 影音 播放 器 中 嵌入 视频 导航 功能 ,可 为 
用 户 提供 基于 视频 场景 和 关键 帧 的 导航 ， 也 可 将 视频 
内 容 文本 或 标签 与 视频 时 间 点 进行 关联 , 基于 JS DN 
本 , 点 击 相应 的 内 容 文本 或 标签 即 可 跳 转 到 相应 的 视 
频 时 间 点 , 实现 基于 视频 内 容 的 导航 。 
3.2 ”功能 框架 

机 构 知 识 库 影音 资源 支持 能 力 扩展 框架 如 图 1 所 
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应 用 认 


IW, 底层 影音 存储 、 加 工 与 标 引 功 能 通过 计算 机 自动 
完成 , 包括 影音 存储 、 格 式 转换 、 技 术 元 数据 提取 、 
场景 分 析 、 关 键 帧 提取 、 内 容 分 析 与 标 引 等 方面 , 经 
过 分 析 处 理 后 的 影音 资源 可 支持 机 构 知 识 库 上 层 的 影 
音 场景 导航 、 关 键 帧 浏览 、 内 容 推荐 等 功能 ， 对 影音 
资源 的 处 理 加 工 深度 和 质量 决定 了 机 构 知 识 库 影 音 资 
源 支 持 服务 的 丰富 性 和 有 效 性 。 影 音 存储 、 加 工 、 标 
引 功 能 涉及 的 技术 和 方法 较为 复杂 , 为 了 提供 稳定 、 
可 靠 的 服务 , 在 功能 实现 过 程 中 ,主要 采用 技术 相对 
成 熟 稳 定 的 算法 和 方法 , 采取 由 浅 入 深 、 逐 步 扩展 的 
方式 进行 。 


内 容 管理 | | 视频 导航 | | 关键 浏览 | | “内容 标注 | 
M 

| 格式 转换 | esos EIDZYEDS 

存储 | | 技术 元 数据 抽取 | | 场景 分 析 | | 关键 由 提 取 | 


图 1 机 构 知 识 库 影 音 资源 支持 功能 框架 
4 关键 技术 研究 与 实验 


影音 资源 存储 、 加 工 和 标 引 所 涉及 的 技术 和 方法 
较 多 ， 对 其 中 的 关键 技术 和 方法 进行 研究 和 实验 , xt 
择 稳定 可 靠 的 功能 , 集成 到 CSpace 系统 中 , 扩展 影音 
支持 服务 功能 ,同时 对 相关 的 技术 和 方法 进行 深入 的 实 
验 研究 , 也 为 进一步 的 影音 支持 能 力 扩展 做 好 铺垫 。 
4.1 视频 格式 转换 

视频 在 线 浏览 主要 采用 FLV 或 MP4 格式, FLV 视 
频 文件 播放 需要 Flash 插件 的 支持 , 在 苹果 iOS 系统 上 
无 法 播放 ,为 了 系统 的 跨 平 台 和 移动 端 应 用 需求 ， 
CSpace 系统 将 视频 统一 转换 为 MP4 格式 。 当 前 视频 
格式 转换 工具 较 多 , FFMPEG 以 其 开源 和 成 熟 的 技术 、 
路 平台 的 特点 得 到 了 广泛 的 应 用 , 支持 对 AVI、MP4、 
FLV, MPG, WMV, 3GP, MOV, ASX, ASF 等 多 
种 常见 影音 格式 进行 编 解码 操作 , 但 不 支持 RM, 
RMVB, WMV9 这 些 和 常见 视频 格式 , 因此 , 在 视频 格 
式 转换 过 程 中 , 对 于 RM, RMVB, WMV9 格式 的 视 
频 文件 首先 采用 另 一 款 格式 转换 工具 MEncoder £7 


换 为 AVI 格式 , 然后 采用 FFMPEG 转换 为 MP4 格式 ， 
FFMPEG 支持 的 视频 直接 转换 为 MP4 格 式 , 为 了 防止 
视频 文件 的 Moov Atom 元 数据 后 置 导 致 的 视频 无 法 
边 加 载 边 播放 问题 ， 视 频 转 换 为 MP4 格式 后 , 通过 
MEncoder 工具 包 中 的 qt-faststart 工具 , 检测 视频 文件 
Moov Atom 元 数据 位 置 , 如 果 位 置 在 视频 文件 的 最 后 ， 
则 将 其 移动 到 文件 前 部 , 格式 转换 流程 如 图 2 所 示 。 


”| FFMPEG L qt-faststart 
MP4 文 件 


图 2 影音 格式 转换 流程 
采用 Java 语言 , 按照 上 述 影 音 转换 流程 ， 通 过 命 
令 行 的 方式 调用 FFMPEG 、MEncoder 和 qt-faststart 构 
建 测试 程序 。 具 体 调用 方式 如 下 所 示 , 采用 两 个 CPU 进 
行 格式 转换 , 将 视频 文件 转换 为 H.264 编码 格式 。 


mencoder 12.rmvb -oac mp3lame -lameopts preset-64 -ovc xvid 


影音 格式 判断 


-xvidencopts bitrate=600 -of avi -o temp.avi 
ffmpeg -itemp.avi-c:vlibx264 -y —threads 2 temp.mp4 
qt-faststart temp.mp4 12.mp4 


分 别 在 Windows $68 fl Linux 平台 进行 视频 格式 
转换 测试 , 测试 文件 分 为 MP4 和 RMVB 两 种 格式 ， 
Linux 实验 平台 采用 VM 虚拟 机 搭建 ， 和 Windows W 
试 系统 采用 相同 的 计算 机 ， 主 要 配置 如 下 : CPU 为 
Intel i7 8 f; 内 存 8GB, 集成 显卡 。 测 试 发 现 : 
FFMPEG 视频 格式 转换 的 时 效 比 (转换 所 需 时 间 / 视 频 
时 长 x100%) 约 为 13%, MEncoder 视频 格式 转换 时 效 比 
约 为 11%, qt-faststart 工具 主要 判断 视频 文件 的 Moov 
Atom 元 数据 信息 位 置 以 及 位 置 转移 工作 ,其 执行 速 
度 较 快 , 可 以 忽略 不 计 , 100 分 钟 的 视频 文件 完成 格式 
转换 最 快 约 需要 13 分 钟 ， 格式 转 换 效率 较 高 ,转换 工 
具 的 运行 也 非常 稳定 。 

4.0 ”视频 分 析 

视频 分 析 过 程 如 图 3 所 示 , 包括 场景 /镜头 分 析 、 
图 像 和 文本 识别 等 方法 和 技术 , 经 过 调研 和 分 析 ， 主 
要 选择 场景 /镜头 分 析 方 面 的 技术 进行 研究 和 实验 。 

视频 镜头 识别 使 用 开源 的 视频 处 理工 具 
OpenCV2.4.91 通过 调研 和 学 习 现 有 的 视频 镜头 识 
别 技术 ， 采 用 图 像 像 素 差 和 双 阔 值 的 方法 ， 初 步 实现 
了 镜头 识别 , 可 获取 每 个 镜头 的 关键 帧 ， 以 及 镜头 的 
起 止 时 间 信 息 ， 并 可 自动 为 每 个 视频 文件 建立 一 个 
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图 像 识别 
> 文本 识别 


«o 场景 /镜头 分 析 


语音 识别 


Pr 
vedés d À s 


抽取 特征 
语义 内 容 索引 < 
抽取 文字 


图 3 视频 分 析 过 程 


XML 文档 , 将 镜头 的 起 止 时 间 、 关 键 帧 图 片 存储 路 径 
言 息 保 存 到 XML 文件 中 (格式 如 下 所 示 ), 实现 了 视频 
一 帧 图 像 结构 的 保存 与 组 织 , 视频 镜头 的 切 分 准确 率 
尚 可 , 但 视频 分 析 的 时 效 性 较 弱 。 


<?xml version="1.0" encoding="utf-8"?> 


<ckplayer> 
«img path»ckplayer/imgframe/«/img path»«!-- 
关键 帧 文件 夹 地 址 --> 
<totaltime>146</totaltime><!-- 视 频 时 间 --> 
<img_button> 
<img> 
<id>1</id> 
<img>1.jpg</img> 
<duration>0,20</duration> 
«mg» 
«img» 
<id>2</id> 
<img>2.jpg</img> 
<duration>20,45</duration> 
</img> 
<img> 
<id>12</id> 
<img>12.jpg</img> 
<duration>128,146</duration> 
</img> 
</img_button> 
</ckplayer> 


4.3 视频 导航 

视频 导航 需要 选择 适当 的 在 线 流 媒 体 播放 器 进行 
二 次 开发 ， 实 现 播放 界面 中 集成 显示 场景 信息 、 关 键 
帧 预览 ， 以 及 视频 播放 定位 功能 ,经 过 调研 分 析 ， 以 国 
内 应 用 广泛 的 CKplayer 视频 播放 器 为 基础 , 采用 
AS3.0 进行 二 次 开发 , 使 其 具有 视频 镜头 导航 功能 ， 
具体 的 播放 导航 效果 如 图 4 所 示 。 


Data Analysis and Knowledge Discovery 


m amn 
M 01:25102:26 — ———Ó 


图 4 具有 视频 导航 功能 的 播放 器 


视频 播放 时 ， 向 播放 器 传递 视频 文件 和 其 对 应 的 
XML 文档 位 置信 息 , 播放 器 通过 XML 文档 中 存储 的 
视频 镜头 起 始 时 间 、 关 键 帧 信息 ,加 载 导航 模块 。 视 
频 导 航 区 域 在 播放 器 视频 播放 区 域 和 时 间 条 之 间 , 将 
鼠标 移动 到 视频 镜头 缩 略 图 上 ,可 大 图 显示 视频 的 关 
键 帧 , 同时 也 可 左右 滑动 鼠标 ,查看 各 个 镜头 的 主要 
VJ, 若 需 要 观看 某 个 视频 片段 ， 可 点 击 相应 镜头 的 
关键 帧 图 片 直 接 将 视频 播放 位 置 切换 到 所 点 击 镜头 的 
播放 位 置 。 

5 CSpace 影音 支持 能 力 扩 展 

通过 研究 现 有 的 影音 支持 关键 技术 ,首先 选择 较 

为 稳定 成 熟 的 视频 格式 转换 技术 应 用 到 CSpace 机 构 


知识 库 系 统 。 视 频 转 码 采用 CSpace 机 构 知识 库 的 事件 
触发 及 处 理 机 制 ” ”具体 转换 机 制 如 图 5 所 示 。 


CSpace 启 动 
技术 元 数据 存储 
时 3 
bs 转 码 状态 

转 码 状态 更 正 


转 码 状 态 


t =.= 


FFMPEG 


转 码 转 码 状态 


ELTE 中 ”格式 转换 格式 转换 定时 任务 


图 5 CSpace 影音 格式 转换 机 制 
视频 文件 以 Bitstream 实体 对 象 的 方式 存储 于 
CSpace 系统 的 bitsteam 表 中 , 一 个 Bitstream 对 象 即 为 
一 条 记录 , 格式 转换 后 的 视频 文件 也 以 Bitstream 对 象 


数据 分 析 与 知识 发现 


的 方式 存储 ,其 与 原始 视频 之 间 通 过 parent_bitstream_ 
id 字段 建立 关联 , 通过 convert status 字段 记录 视频 的 
格式 转换 状态 ,转换 状态 定义 如 下 所 示 : 
public static final int BITSTREAM CONVERT NOW=1; 
// 影 音 立 即 开始 转 码 
public static final int BITSTREAM CONVERT AUTO-2; 
// 根 据 影音 转 码 任务 确定 转 码 时 机 
public static final int BIISTREAM CONVERT ON-3; 
// 转 码 中 
public static final int BITSTREAM CONVERT FINISH=4; 
// 转 码 完成 
public static final int BITSTREAM CONVERT ERROR=5; 
// 转 码 失败 
在 CSpace 系统 的 条 目 提交 /编辑 过 程 中 ， 当 视频 
文件 上 传 成 功 后 ,系统 自动 调用 FFMPEG 提取 视频 文 
件 的 时 长 、 分 辨 率 、 码 率 、 格式 等 技术 元 数据 信息 , TÉ 
储 到 数据 库 中 。 巾 于 视频 格式 转换 需要 耗费 服务 需 较 
多 的 CPU 和 内 存 资源 , 为 了 兼顾 用 户 的 各 种 应 用 需 
R, 设置 视频 格式 转换 时 机 选项 , 在 如 图 6 所 示 的 文 
件 列表 中 , 用户 可 点 击 修改 按钮 ， 在 文件 信息 编辑 部 
分 , 设置 视频 文件 格式 转换 的 时 机 ， 如 果 提 交 者 不 选 
择 格式 转换 的 时 机 , 则 条 目 提 交 或 更 新 时 ， 系 统 将 根 
据 视 频 文 件 的 时 长 信息 ,进行 格式 转换 时 机 判断 , A 
时 长 小 于 两 小 时 则 将 其 加 入 到 文件 转换 队列 中 , 更 新 
数据 库 中 的 格式 转换 状态 为 正在 转换 ; 若 视 频 时 长 超 
过 两 个 小 时 ,， 则 将 格式 转换 状态 设置 为 BITSTREAM_ 
CONVERT AUTO, CSpace 系统 设置 了 视频 转换 定时 
任务 ,在 每 天 凌晨 两 点 自动 启动 转换 任务 ， 从 
bitstream 表 中 往 选 未 进行 格式 转换 的 视频 文件 , 以 ID 
为 排序 依据 , 将 前 5 个 视频 文件 加 入 到 视频 格式 转换 
队列 中 进行 格式 转换 ,在 视频 格式 转换 的 各 个 阶段 ， 
都 会 对 数据 库 中 的 格式 转换 状态 字段 进行 更 新 。 


知识 共享 轩 名 - 非 修改 
z 商业 性 使 用 -相同 oon 
12.mp4 影音 立即 转换 方式 共享 许可 协 开放 获取 生成 
议 删除 
知识 共享 叶 名 - 非 修改 
O sexe T: 自动 选择 空 商业 性 使 用 -相同 - 
O 实验 过 程 1 rmvb EE egret 
议 删除 
全 文 权限 设置 
全 文 名 称 实验 过 程 1 .rmvb 
文献 类 型 影音 id 
版 本 
格式 转换 口 立即 转换 
许可 知识 共享 署名 - 非 商 业 性 使 用 -相同 方式 共享 许可 协议 Y 
http://creativecommons.org/licenses/by-nc-sa/4.0/ 
访问 权限 发 布 时 限 : ”| 立即 发 布 Y 话 线 浏览 : | 无 限制 ”| 全 文 下 载 : | 无 限制 V 
填写 元 数据 || 确定 || 取消 


图 6 影音 转换 时 机 设置 
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视频 文件 加 入 到 转换 队列 后 , 文件 的 转换 状态 将 
更 新 为 正在 转换 状态 , 在 等 待 或 转换 过 程 中 ， 如 果 
CSpace 服务 重启 或 者 停止 , 视频 文件 的 状态 则 一 直 停 
留 在 正在 转换 状态 , 这 种 情况 下 , 为 了 保持 视频 文件 
转换 状态 的 正确 性 ，CSpace 系统 将 会 在 启动 过 程 中 ， 
自动 更 新 这 些 错误 的 视频 格式 转换 状态 。 

影音 资源 分 布 于 机 构 知 识 库 的 条 目 中 , 为 了 对 其 
进行 统一 管理 ，CSpace 加 入 了 视频 管理 功能 ， 界面 如 
图 7 所 示 , 在 页 面 中 可 进行 选项 卡 的 切换 ,查看 转 码 
完成 、 转 码 中 以 及 等 待 转 码 的 视频 文件 信息 ， 点 击 列 
表 中 “操作 ” 列 的 “查看 ”按钮 可 进入 视频 所 在 的 条 目 
进而 详细 浏览 页 面 ; 点 击 “ 修 改 ” 按 钮 ,可 直接 进入 视 
频 文件 所 在 条 目的 修改 页 面 , 可 在 如 图 6 所 示 的 修改 
页 面 点 击 “ 修 改 ” 或 “生成 ”按钮 ,修改 视频 文件 的 元 数 
据 信息 或 者 立即 进行 视频 文件 格式 转换 操作 。 


转 码 完成 转 码 中 等 待 转 码 
序号 文件 名 文件 大 小 (MB) 时 长 操作 
T 1.mp4 23.6 00:03:20 ec 
z 12.mp4 30.64 00:03:20 ec 
3 实验 过 程 1.rmvb 141.52 00:43:16 ec 
第 1 到 第 3 条 , 共 3 条 


图 7 视频 管理 


其 他 影音 支持 功能 如 场景 分 析 、 播 放 导 航 等 , 由 
于 前 期 的 实验 结果 离 应 用 还 存在 一 定 的 差距 ,因此 和 暂 
未 集成 到 CSpace 系统 中 , 未 来 需要 持续 关注 相关 方法 
和 技术 的 发 展 动态 , 将 更 为 成 熟 稳定 的 方法 和 技术 应 
用 到 CSpace 系统 中 ,进一步 完善 其 影音 支持 功能 。 


6 结 语 


随 着 信息 技术 和 多 媒体 技术 的 发 展 , 机构 知识 库 
影音 文件 的 存储 和 应 用 需求 不 断 提 高 ,为 了 适应 用 户 
对 影音 资源 应 用 的 新 需求 , 本 文 基于 用 户 的 应 用 需求 
和 国内 外 机 构 知 识 库 或 专门 数字 知识 库 平台 影音 支持 
服务 的 发 展 趋势 ,构建 了 机 构 知识 库 影 音 资源 支持 功 
能 扩展 框架 ,并 对 一 些 关键 技术 和 方法 进行 了 研究 和 
实现 , 在 此 基础 上 , 选择 较为 成 熟 稳定 的 视频 转 码 功 
能 应 用 到 CSpace 系统 中 , 扩展 了 CSpace 机 构 知 识 库 
的 影音 资源 管理 和 支持 能 力 。 未 来 还 需 持 续 关 注 相 关 
技术 和 方法 的 最 新 研究 进展 , 同时 对 影音 支持 能 力 扩 


ChinaXiv 合 作 期 刊 


总 第 9 期 2017 年 第 9 期 


展 框 架 中 涉及 的 其 他 技术 和 方法 进行 研究 , 逐步 扩展 
机 构 知 识 库 影音 支持 功能 ,向 为 用 户 提供 像 获 取 和 使 
用 文本 资源 一 样 便利 的 影音 知识 资源 迈进 。 
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Expanding Support Ability of CSpace for Audios and Videos 
Resources 


WuZhiqiang Zhu Zhongming Yao Xiaona Wang Sili 
(Lanzhou Literature and Information Center, Chinese Academy of Sciences, Lanzhou 730030,China) 


Abstract: [Objective] The paper aims to expand the supporting ability of the CSpace Institutional Repository for 
audios and videos. [Context| The ever-growing audios and videos resources, require us to expand the Institutional 
Repository's supporting ability, which help us retrieve knowledge and increase their academic values more effectively. 
[Methods] First, we analyzed the needs of users and the developments of Institutional Repository's audios and videos 
supporting services at home and abroad. Then, we constructed an extension framework for the supporting functions. 
Finally, we chose the key technologies and methods to build the experimental platform, and explored its feasibility in 
CSpace. [Results] The proposed method helped us change audios and videos clips! formats, analyze video scenes and 
develop a video player with scene navigation functions. [Conclusions] The transcoding technology for audios and 
videos works effectively. However, other supporting functions could be further improved. The format conversion 
technology for audios and videos in CSpace could expand its supporting services. 
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